iT邦幫忙

2023 iThome 鐵人賽

DAY 7
0
AI & Data

量化交易與機器學習系列 第 7

因子投資(Factor Investing)

  • 分享至 

  • xImage
  •  

可預測性的研究通常依賴於有關市場回報可預測性的預測變量。
例如:股息收益率、名義收益率和收益率利差。

當特定行業出現現金流不穩定時,訊息處理的限制會阻礙專門從事相關行業的投資者快速了解市場。
由此導致的股票價格的延遲調整,導致基於滯後行業回報的可預測性。

最小二乘(Ordinary Least Squares, OLS)

預測回歸模型中存在過多的潛在預測變量,傳統的普通 OLS 估計有潛在的缺點。
如果使用所有滯後回報,大量的預測變量會使 OLS 估計容易出現過度擬合。
如果只選擇少數滯後回報,則很難先驗地知道哪些是最重要的。

Lasso演算法

採用最小絕對收縮和選擇運算子(least absolute shrinkage and selection operator, Lasso)方法可以防止高維設置中的資料過度擬合,並選擇最相關的預測變量。

LASSO 依賴於 L1 懲罰項,因此它允許某些權重收縮到恰好為零。
因此,它執行變量選擇,這通常會產生稀疏模型,減輕了資料的過度擬合。
稀疏性有兩個關鍵優勢:

  1. 將"不重要"權重設置為零有助於避免資料過度擬合。
  2. 通過識別最相關的預測變量來促進對估計模型的解釋。
    但它也傾向於"過度縮小"所選變量的權重。
    這種趨勢可能導致估計權重出現顯著的向下偏差。

Post-LASSO OLS 估計

使用 LASSO 來降低模型的維度;為了減少 LASSO 權重估計中的偏差,使用 OLS 重新估計所選預測變量的權重。


上一篇
集成學習(Ensemble Learning)和訊號理論(Signaling Theory)預測收益
下一篇
現代投資組合理論(Modern Portfolio Theory, MPT)
系列文
量化交易與機器學習30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言